A partir del siguiente dataset, se solicita trabajar sobre las siguientes consignas:
Explore y explique en que consiste el dataset utilizando herramientas de exploración de datos.
str(MPI_subnational)
## spec_tbl_df [984 × 8] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
## $ ISO country code : chr [1:984] "AFG" "AFG" "AFG" "AFG" ...
## $ Country : chr [1:984] "Afghanistan" "Afghanistan" "Afghanistan" "Afghanistan" ...
## $ Sub-national region : chr [1:984] "Badakhshan" "Badghis" "Baghlan" "Balkh" ...
## $ World region : chr [1:984] "South Asia" "South Asia" "South Asia" "South Asia" ...
## $ MPI National : num [1:984] 0.295 0.295 0.295 0.295 0.295 0.295 0.295 0.295 0.295 0.295 ...
## $ MPI Regional : num [1:984] 0.387 0.466 0.3 0.301 0.325 0.313 0.319 0.25 0.245 0.384 ...
## $ Headcount Ratio Regional : num [1:984] 67.5 79.3 59.7 55.7 61 65.1 61.4 49.4 47.4 74.6 ...
## $ Intensity of deprivation Regional: num [1:984] 57.3 58.8 50.3 54.1 53.3 48.1 52 50.6 51.6 51.5 ...
## - attr(*, "spec")=
## .. cols(
## .. `ISO country code` = col_character(),
## .. Country = col_character(),
## .. `Sub-national region` = col_character(),
## .. `World region` = col_character(),
## .. `MPI National` = col_double(),
## .. `MPI Regional` = col_double(),
## .. `Headcount Ratio Regional` = col_double(),
## .. `Intensity of deprivation Regional` = col_double()
## .. )
## - attr(*, "problems")=<externalptr>
Se trata de un dataset que contiene 984 entradas o filas, y 8 atributos o columnas. Los datos corresponden a Medidas de pobreza publicado por “Oxford Poverty & Human Development Initiative”. Resulta necesario para comprender algunos atributos, conocer del Índice de Pobreza Multidimensional, IPM o MPI. El cual es una medida internacional de pobreza multidimensional aguda que cubre más de 100 países en desarrollo. Dichos atributos son:
Calcule las medidas de posición para los atributos numéricos y agrupe los cálculos de acuerdo a la región.
Media Aritmética, Mediana y Moda ordenada por región mundial, del MPI Nacional:
## # A tibble: 6 × 4
## Region `Media Aritmetica` Mediana Moda
## <chr> <dbl> <dbl> <dbl>
## 1 Arab States 0.111 0.045 0.0140
## 2 East Asia and the Pacific 0.124 0.1 0.066
## 3 Europe and Central Asia 0.0289 0.008 0.008
## 4 Latin America and Caribbean 0.0543 0.034 0.072
## 5 South Asia 0.209 0.196 0.295
## 6 Sub-Saharan Africa 0.332 0.307 0.303
Medidas poblacionales del MPI Nacional:
## Media.Aritmetica Mediana Moda
## 1 0.2041067 0.174 0.066
Media Aritmetica, Mediana y Moda ordenada por región mundial, del MPI Regional:
## # A tibble: 6 × 4
## Region `Media Aritmetica` Mediana Moda
## <chr> <dbl> <dbl> <dbl>
## 1 Arab States 0.115 0.052 0.006
## 2 East Asia and the Pacific 0.136 0.0995 0.053
## 3 Europe and Central Asia 0.0253 0.016 0.021
## 4 Latin America and Caribbean 0.0637 0.0375 0.03
## 5 South Asia 0.220 0.199 0.294
## 6 Sub-Saharan Africa 0.337 0.333 0.292
Medidas poblacionales del MPI Regional:
## Media.Aritmetica Mediana Moda
## 1 0.2113303 0.155 0.006
Media Aritmetica, Mediana y Moda ordenada por región mundial, del Headcount Ratio Regional o porcentaje de gente pobre según el MPI Regional:
## # A tibble: 6 × 4
## Region `Media Aritmetica` Mediana Moda
## <chr> <dbl> <dbl> <dbl>
## 1 Arab States 23.1 12.5 2.2
## 2 East Asia and the Pacific 28.3 23 13.4
## 3 Europe and Central Asia 6.43 4.1 6.1
## 4 Latin America and Caribbean 14.2 8.95 1.4
## 5 South Asia 44.1 45.2 65.1
## 6 Sub-Saharan Africa 61.5 66.6 72
Medidas poblacionales del Headcount Ratio Regional:
## Media.Aritmetica Mediana Moda
## 1 40.18445 33.95 6.5
Media Aritmetica, Mediana y Moda ordenada por región mundial, del Intensity of Deprivation Regional o distancia promedio a la que se encuentra la gente pobre respecto de la línea de pobreza:
## Region Media Aritmetica Mediana Moda
## 1 Arab States 42.65391 40.6 40.6
## 2 East Asia and the Pacific 45.60156 44.7 42.7
## 3 Europe and Central Asia 37.08182 36.0 33.3
## 4 Latin America and Caribbean 41.53871 41.4 39.8
## 5 South Asia 47.63951 46.6 48.1
## 6 Sub-Saharan Africa 51.87030 50.4 47.3
Medidas poblacionales del Intensity of Deprivation Regional:
## Media.Aritmetica Mediana Moda
## 1 47.18098 45.6 41.9
CONCLUSIONES:
En el MPI Nacional, las únicas 2 regiones que se encuentran por debajo de la media poblacional son Arab States y East Asia and the Pacific.
Cuando se trata del MPI Regional, South Asia y Sub-Saharan Africa se encuentran por encima de la media poblacional.
En el caso del atributo Headcount Ratio Regional, al igual que en el anterior, South Asia y Sub-Saharan Africa superan el valor de la media poblacional.
Evaluando la columna Intensity of Deprivation Regional, de igual manera que en los dos anteriores, South Asia y Sub-Saharan Africa, superan el valor de la media poblacional.
Resumiendo, South Asia y Sub-Saharan Africa, en ninguna medida de posición, están por debajo de la media poblacional. Aunque Sub-Saharan Africa supera siempre mucho más holgadamente el valor de la media poblacional que en South Asia.
OBSERVACIONES:
Calcular la desviación estándar, la varianza y el rango para cada una de las variables.
MPI National
## [1] 0.1602476
## [1] 0.599
## [1] 0.02567929MPI Regional
## [1] 0.183621
## [1] 0.744
## [1] 0.03371667Headcount Ratio Regional
## [1] 29.9814
## [1] 99
## [1] 898.8845Intensity of deprivation Regional
## [1] 8.047225
## [1] 42.6
## [1] 64.75784CONCLUSIONES:
La variable que presenta mayor dispersión es Headcount Ratio Regional o Porcentaje de gente pobre. Tal como se comentó en conclusiones anteriores, dicha columna presenta el mayor Desvío Estándar, Rango y Varianza.
Calcular el coeficiente de correlación de todas las variables y explique el resultado. ¿Qué tipo de gráficos describen mejor esta relación entre las variables?
## [1] 0.8591325
## [1] 0.8555896
## [1] 0.8136333
## [1] 0.9839779
## [1] 0.9446785
## [1] 0.9029842
CONCLUSIONES: